运维思索:基础设施自动化落地
读完需 4 分钟
速读需 2 分钟
前言
前面《运维思索》系列文章已经将我们的自动化运维之路铺好,接下来我们要进入的是基础设施自动化落地。本文希望能够将《运维思索》系列与之前分享的一些文章进行有效的串联,让历史文章不再孤单,再次发挥余热。
串联
在运维思考:运维管理与运维自动化一文中讲到了运维自动化的几个阶段:操作自动化>场景自动化>智能化
,其在基础设施层的落地主要体现为:
操作自动化
运维思索:操作系统配置规范化、自动化一文,基于配置
规范
结合ansible实现了部分功能的操作自动化:
(1)操作系统配置初始化、用户配置自动化、安全配置自动化;
(2)基础组件的自动化部署,如:java、nginx、中间件、python等;
此阶段配置规范
为核心,ansible、saltstack等自动化工具为辅助工具。场景自动化
基础设施层主要是网络设备、虚拟化集群、物理机等,通过cmdb、堡垒机、监控去管理,因此主要场景有:
(1)服务器上架,需依次接入cmdb、堡垒机、监控等管理层服务;
(2)服务器下架,需依次注销cmdb、堡垒机、监控等管理层服务;
在服务器基数小的情况下,我们可以手动在各个平台注册主机;一旦需要批量上下架,工作量将会指数增长。因此我们需要这些场景自动化来为我们减负。智能化
在此阶段的智能化,我只能联想到故障自愈,与监控平台形成有效联动,实现故障的自动恢复。
在此我们主要介绍场景自动化。
场景自动化
传统的运维核心是以解决孤立的问题为目标,因此当云日趋成熟,让很多运维同学觉得要失业。因为云屏蔽了底层的基础设施,能够让企业将更多的精力放到业务上。转换下思路,运维在企业中是否就是扮演的‘云’的角色,我们要保证的是
业务连续性
资源的快速交付
应用可靠性
因此我们要扮演好’云’的角色,此时就需要依赖操作自动化、场景自动化和智能化三者的互相配合。操作自动化是基础、场景自动化是关键、智能化是保障。因此我们就需要在关键处下手。
基础设施层大部分的工作在于服务器资源的交付,因此运维要保证资源的快速交付,此时就可以靠场景自动化来解决。
场景一
基础设施资源一般通过cmdb、jumpserver、vsphere、监控等不同运维工具纳管,我们如何实现服务器资源的一站式交付?场景二
某个业务下架,我们如何从cmdb、jumpserver、vsphere、监控等运维工具中下架关联资产?
以上是两个非常常见的场景,我们该如何实现场景驱动呢?
最佳实践
对于运维来说,通过Web界面输入参数、一键执行实现整个场景的自动化交付,我认为就是最佳实践。
在此特借助蓝鲸标准运维实现了虚拟机交付,实现虚拟机创建、定制ip、jumpserver自动添加资产及用户推送、注册蓝鲸cmdb,发送邮件通知。
我们通过蓝鲸标准运维框架,定制了vsphere、jumpserver、cmdb三个原子,用于打通三个平台,实现了单台虚拟机交付在1.3 分钟左右。
1.订制场景流程
2.填写参数
3.一键执行
具体实现可参考以下文章:
腾讯蓝鲸实现vsphere虚拟机交付
蓝鲸实现vsphere虚拟机交付 -虚拟机管理(VSPHERE)
总结
基础设施的管理是运维工作的根本,如果管理混乱,那么上层应用也不好不到哪去。因此运维不管到哪,都要做好场景化的梳理,通过运维流程去定义,做可持续的自动化,保证团队中任何人都可以无缝交接。
集群外独立部署Prometheus+Grafana监控K8S全面解析
你与世界
只差一个
公众号